我们介绍Cendernet,这是一个基于中心和曲率表示的多视图图像的6D姿势估计的框架。为反光,无纹理对象寻找精确的姿势是工业机器人技术的关键挑战。我们的方法包括三个阶段:首先,一个完全卷积的神经网络可预测每种观点的中心和曲率热图;其次,中心热图用于检测对象实例并找到其3D中心。第三,使用3D中心和曲率热图估算6D对象姿势。通过使用渲染和能力方法共同优化视图的姿势,我们的方法自然处理遮挡和对象对称性。我们表明,Cendernet在两个与行业相关的数据集上优于以前的方法:DIMO和T-less。
translated by 谷歌翻译
我们提出KeyCLD,这是一个从图像中学习拉格朗日动态的框架。学到的关键点代表图像中的语义标志性,可以直接代表状态动力学。将这种状态解释为笛卡尔坐标,并与明确的自动限制相结合,允许用约束的拉格朗日表达动力学。我们的方法显式地对动能和势能进行了建模,从而允许基于能量的控制。我们是第一个从DM_Control Pendulum,Cartpole和Acrobot环境中的图像中展示Lagrangian动力学学习的人。这是从现实世界图像中学习拉格朗日动力学的迈出的一步,因为以前的文学作品仅适用于在空背景上具有单色形状的简约图像。请参阅我们的项目页面以获取代码和其他结果:https://rdaems.github.io/keycld/
translated by 谷歌翻译
对于自动导航和机器人应用,正确感知环境至关重要。存在许多用于此目的的感应方式。近年来,一种使用的方式是空中成像声纳。它在具有灰尘或雾之类的粗糙条件的复杂环境中是理想的选择。但是,就像大多数传感方式一样,要感知移动平台周围的完整环境,需要多个此类传感器来捕获完整的360度范围。当前,用于创建此数据的处理算法不足以以相当快的更新速率为多个传感器这样做。此外,需要一个灵活而健壮的框架,以轻松地将多个成像声纳传感器实现到任何设置中,并为数据提供多种应用程序类型。在本文中,我们提出了一个专为这种新型传感方式而设计的传感器网络框架。此外,提出了在图形处理单元上的处理算法的实现,以减少计算时间,以便以足够高的更新速率实时处理一个或多个成像声纳传感器。
translated by 谷歌翻译
估计六级自由人体姿势的系统已有二十年多了。诸如运动捕获摄像机,高级游戏外围设备以及最近的深度学习技术和虚拟现实系统等技术都显示出令人印象深刻的结果。但是,大多数提供高精度和高精度的系统都是昂贵的,并且不容易操作。最近,已经进行了研究以使用HTC Vive虚拟现实系统估算人体姿势。该系统显示出准确的结果,同时将成本保持在1000美元以下。该系统使用光学方法。通过在接收器硬件上使用照片二极管来跟踪两个发射器设备发射红外脉冲和激光平面。以前开发了使用这些发射器设备与低成本定制接收器硬件结合使用的系统,但需要手动测量发射机设备的位置和方向。这些手动测量可能很耗时,容易出错,并且在特定设置中不可能。我们提出了一种算法,以使用自定义接收器/校准硬件的任何选择的环境中自动校准发射机设备的姿势。结果表明,校准在各种设置中起作用,同时比手动测量所允许的更准确。此外,校准运动和速度对结果的精度没有明显的影响。
translated by 谷歌翻译